1
Основы аппроксимации норм
MATH008Lesson 6
00:00
Представьте, что вы портной, пытающийся подогнать стандартный костюм (диапазон матрицы $A$) клиенту с уникальными пропорциями (вектор $b$). Независимо от того, как вы корректируете рукав или пояс (коэффициенты $x$), костюм никогда не будет идеально прилегать. Вы ищете «наилучшее» компромиссное решение — аппроксимация норм которое минимизирует напряжение или «остаток» в каждом шве.

Математическая основа

Основная цель — найти вектор $x \in \mathbb{R}^n$, такой что линейная комбинация $Ax = x_1a_1 + \dots + x_na_n$ наилучшим образом аппроксимирует $b$. Это часто называют регрессией $b$ на регрессоры (столбцы матрицы $A$).

Мы сосредоточены на векторе остатков $r = Ax - b$. На практике мы предполагаем переопределённую систему где $m > n$. Почему? Потому что при $m = n$ и невырожденной матрице $A$ оптимальная точка просто $A^{-1}b$, что даёт нулевую ошибку — тривиальный случай для оптимизации.

🎯 Ключевой принцип
Задача аппроксимации норм (6.1) является выпуклой задачей и гарантированно является разрешимой. Всегда существует хотя бы одно оптимальное решение $\hat{x}$, которое минимизирует расстояние между целью и достижимым подпространством.

Канонические вариации

В зависимости от «характера» ошибки, которую мы хотим наказывать, выбираем разные нормы:

1. Метод наименьших квадратов ($\ell_2$ норма)

Наиболее распространённый подход. Он минимизирует сумму квадратов остатков: $\|Ax - b\|_2^2$. Чувствителен к большим выбросам, но предоставляет аналитическое решение через нормальные уравнения.

2. Чебышёва / Минимакс ($\ell_\infty$ норма)

Минимизирует максимум абсолютного остатка $\max_i |r_i|$. Используется, когда каждое измерение должно оставаться в строгих пределах допуска. Может быть решено с помощью следующей линейной программы (ЛП):

минимизировать $t$
при условии $-t\mathbf{1} \preceq Ax - b \preceq t\mathbf{1}$

3. Сумма абсолютных остатков ($\ell_1$ норма)

Минимизирует $\sum |r_i|$. Этот подход устойчив к выбросам, так как не возводит ошибки в квадрат. Также может быть решён с помощью ЛП:

минимизировать $\mathbf{1}^T t$
при условии $-t \preceq Ax - b \preceq t$

Контекст оценки

Во многих инженерных областях мы предполагаем, что истинное состояние $x$ маскируется шумом: $y = Ax + v$. Наша цель — найти оценку $\hat{x} = \text{argmin}_z \|Az - y\|$. Выбирая норму, мы фактически делаем предположение о статистическом распределении шума $v$.

\text{Минимизировать } \|u - b\| \text{ при условии } u \in \mathcal{A} \quad (\text{где } \mathcal{A} = \text{Range}(A))